AI大模型太“卷”了!百度、抖音、商汤等获批,华为、腾讯、360在路上
导读
首批大模型产品获批名单问世,共有8款AI大模型,涵盖国内知名科技企业、初创企业以及科研机构。
来源 | 数据观综合(转载请注明来源)
8月31日,据财联社报道,从多位独立信源处获悉,国内将有11家大模型陆续通过《生成式人工智能服务管理暂行办法》备案,首批将在8月31日起将陆续向全社会公众开放服务。
产品获批后,上述企业机构的大模型产品,即可在网站/应用商店下载后直接使用。
首批大模型面向社会公众开放
首批大模型产品获批名单共有8款AI大模型,涵盖国内知名科技企业、初创企业以及科研机构。其中,有3家知名科技企业,包括百度(文心一言)、抖音(云雀大模型)及商汤(日日新大模型);3家初创企业为智谱AI(GLM大模型)、百川智能(百川大模型)、MiniMax(ABAB大模型);两家科研机构是中科院(紫东太初大模型)、上海人工智能实验室(书生通用大模型)。按地域划分,北京为5家,上海3家。
另据报道称,华为、腾讯,科大讯飞、360等AI大模型也将陆续获批,向社会公众开放。
8月31日凌晨,百度宣布文心一言将从8月31日起率先向全社会全面开放。用户可以在应用商店下载“文心一言APP”或登录“文心一言官网”体验。据悉,百度还将开放一批经过全新重构的AI原生应用,让广大用户充分体验生成式AI的理解、生成、逻辑、记忆四大核心能力。
除了百度文心一言以外。王小川创办的百川智能也于8月31日对外宣布,已率先通过《生成式人工智能服务管理暂行办法》备案,今日起面向全社会开放服务,成为首批通过备案的8家公司之一。
8月31日,智谱AI正式上线首款生成式AI助手“智谱清言”,已在各大应用商店上线。
8月31日,商汤日日新大模型旗下自然语言应用“商量SenseChat”正式面向广大用户开放服务。用户可访问https://chat.sensetime.com注册使用,或通过商汤官网访问体验。
此外,尽管还没有官宣全面开放,但目前抖音“豆包”、科大讯飞星火认知等也可以注册使用。
以下为首批获批上线的大模型企业介绍:
百度-文心一言大模型
作为全球大厂中首个发布的生成式 AI 产品,百度“文心一言”于2023年3月16日开启邀测,基础模型文心大模型早在 2019 年就在国内率先发布,近期升级的文心大模型 3.5 也持续在十余个国内外权威测评中位居第一。
百度创始人、董事长兼首席执行官李彦宏表示,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言,创造更好的用户体验。
近十年,百度累计研发投入超 1400 亿元,压强式研发投入让百度实现厚积薄发,成为全球为数不多的、有着应用、模型、框架、芯片四层全栈布局的 AI 公司,实现端到端优化,并在各个层面都有领先业界的关键自研技术。
抖音集团-云雀大模型
8月17日,抖音集团(前字节跳动)宣布开始对外测试AI对话产品“豆包”。据称,“豆包”是字节跳动公司基于云雀模型开发的 AI 工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台,但 iOS 需要使用 TestFlight 安装。
智谱AI-GLM大模型
成立于2019年的智谱AI,是国内最早一批研发大模型的企业,由清华大学知识工程实验室(KEG)技术成果转化。
当前,智谱已经发布包括双语千亿级超大规模预训练模型GLM-130B,中英双语对话模型ChatGLM、认知大模型平台Bigmodel.ai,包括CodeGeeX和CogView等产品。
基于ChatGLM,智谱已于今年推出To C聊天对话应用“智谱清言”。而在To B层面,智谱也已经与多家国内互联网巨头,政企达成合作。
百川智能-百川大模型
百川成立于2023年,由搜狗创始人王小川创立。今年6月15日,百川智能推出70亿参数量的中英文语言模型Baichuan-7B,一个月后又接连发布了参数量130亿的通用大语言模型Baichuan-13B-Base、对话模型Baichuan-13B-Chat及INT4/INT8两个量化版本。前不久,百川智能刚刚宣布推出新一代大模型Baichuan-53B。
中科院自动化研究所-紫东太初大模型
中科院自动化研究所成立于1956年10月,是中国最早成立的国立自动化研究机构。“紫东太初”定位为跨模态通用人工智能平台,于2021年正式发布。
目前,“紫东太初”参数已达千亿级别,拥有视觉、文本、语音多种模态,基于全栈国产化基础软硬件平台建立。今年6月,紫东太初发布2.0版本,再加入了视频、传感信号、3D点云等新的模态数据。目前,紫东太初已在文本创作、医疗、物流、政务等多个行业实现应用落地。
商汤-日日新大模型
今年4月,商汤推出日日新SenseNova”大模型。据悉,日日新大模型拥有提供自然语言、内容生成、自动化数据标注、自定义模型训练等多种能力,其中还包括商量SenseChat、秒画SenseMirage、如影SenseAvatar、琼宇SenseSpace、格物SenseThings、明眸等功能强大且易用的内容生成平台产品。目前,商汤最新版大模型“商量SenseChat 2.0版本”已发布,其参数达千亿级规模。
Minimax-ABAB大模型
Minimax成立于2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,推出自研通用大模型“ABAB”,以及虚拟聊天软件Glow、生成式对话AI产品Inspo等。
Minimax也是如今国内估值最高的大模型初创公司之一。据路透6月报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。
上海人工智能实验室-书生大模型
上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。
2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。
内卷的AI大模型
当前,中国大模型呈现蓬勃发展态势。科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,从全球已经发布的大模型分布来看,中美两国数量合计占全球总数的超 80%,美国在大模型数量方面居全球之首,中国目前则已进入大模型快速发展期,与美国保持同步增长态势。
据不完全统计,截止今年5月,中国 10 亿参数规模以上的大模型已发布 79 个。IDC预测,2026年中国人工智能软件及应用市场规模将达到211亿美元,人工智能将进入大规模落地应用关键期。
我国2020年进入大模型加速发展期,目前与美国保持同步增长态势。在自然语言处理、机器视觉和多模态等各技术分支上均在同步跟进、快速发展,涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。
报告显示,目前中国在14个省市/地区均有团队在开展大模型研发,北京、广东两地最多,地域集中度相对较高。从领域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,学术界与产业界之间的联合开发还不充分。
通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近3年人工智能服务器采购数量最多的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共智能算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。
《报告》分析发现,目前中国大模型产业化应用大致出现两种并行的发展路径,文心一言、通义千问、紫东太初等中国一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。
与此同时,一批针对生物制药、遥感、气象等垂直领域的专业类大模型,正在发挥其领域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案。
根据腾讯研究院、同济大学、腾讯云、腾讯新闻共同发布的《人机共生——大模型时代的AI十大趋势观察》报告,“大模型”已可以在多个领域催生出全新的商业价值,第一批跨功能的应用程序已在眼前:金融、零售、政府、制造、物流、地产、教育等多个行业,以及财务、HR、客服等应用场景,“大模型”展现了出色能力。报告预测,各行业都将迅速整合大模型的能力。与其他颠覆型技术一样,这种变革一开始会缓慢发展,然后迅速加速。
国内百大模型列表及排名
为了更好地评估和比较这些模型在中文领域的表现,已经有针对中文的通用大模型的测评基准。
中文通用大模型基准(SuperCLUE)就是其中的一个测评基准,尝试对主流的AI通用模型进行一个可量化的对比评分。它主要回答的问题是:在当前通用大模型大力发展的情况下,中文大模型的效果情况。包括但不限于:这些模型不同任务的效果情况、相较于国际上的代表性模型做到了什么程度、 这些模型与人类的效果对比。SuperCLUE从三个不同的维度评价模型的能力:基础能力、专业能力和中文特性能力。其中专业能力包括中学、大学与专业考试,涵盖了从数学、物理、地理到社会科学等50多项能力。
国内百大模型列表
近日,SuperCLUE发布了中文大模型8月榜单。8月榜单由5部分组成:总排行榜、OPEN多轮开放问题排行榜、OPT三大能力客观题排行榜、十大基础能力排行榜、开源排行榜。
2023年8月SuperCLUE中文大模型总排行榜
2023年8月SuperCLUE-OPEN排行榜
2023年8月 SuperCLUE-OPT排行榜
2023年8月 SuperCLUE 基础能力排行榜
2023年8月 SuperCLUE 开源排行榜
从榜单上的测评结果来看,国内大模型在中文任务上的表现与GPT3.5仍有一定距离,但差距在持续缩小;开源模型竞争力进一步提升;模型在开放问题和客观选择题的表现有不一致的情况。
监管政策逐步落实,大模型加速走向应用
今年以来热度极高的大模型,一直是各互联网大厂竞逐的赛道,各大科技公司均推出了自家的大模型,呈现出“百模大战”的盛况。
但是,生成式AI落地面临着监管方面的限制,这也是大模型产品迟迟未能向公众开放的重要原因。在获得备案审批之前,各家只是在小范围进行内测,用户则需要“排队”申请内测资格。
4月11日,国家互联网信息办公室发布的关于《生成式人工智能服务管理办法(征求意见稿)》提出,利用生成式人工智能产品向公众提供服务前,应当按照《具有舆论属性或社会动员能力的互联网信息服务安全评估规定》向国家网信部门申报安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
6月20日,国家网信办发布了关于深度合成服务算法备案信息的公告,公开发布境内深度合成服务算法备案信息。41个深度合成服务算法被纳入清单,涉及26家公司,百度、阿里巴巴、腾讯、字节跳动、美团等互联网大厂均榜上有名。
8月15日,由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》正式实施,这也是我国首个针对生成式人工智能产业的规范性政策。
相关监管政策的逐步落实,国内大模型企业有了明确的政策准入,生成式AI的发展也有了更多的确定性。随着首批通过备案的大模型率先向用户开放,大模型赛道上的“抢跑者”率先过线,进入公众眼球,并有望在未来的市场竞争中获得更多的先发优势。业界预计,大模型在下一个阶段有望迎来应用层之战。
▐ 风口洞察
▐ 行业报告
▐ 国际要闻
▐ 数据观出品